مسائل زبان و خط فارسی در ذخیره سازی و بازیابی اطلاعات
نویسندگان
چکیده
بانک های اطلاعاتی فارسی ، پیش از آن که فرهنگستان زبان معیارهای لازم را برای کاربرد اصطلاحات علمی و رسم الخط فارسی تعیین کند شکل گرفتند. مجریان بانک های اطلاعاتی و نمایه سازان ، خواسته یا ناخواسته ـ با مسائل واژه گزینی و جنبه هایی از زبانشناسی درگیر شدند. در کار واژه گزینی ، اطلاع رسانان ـ به لحاظ ماهیت حرفه خود ـ واژه های رایج در جامعه تولیدکنندگان و استفاده کنندگان از اطلاعات را مد نظردارند و خود را مجاز به واژه سازی و اعمال سلیقه نمی دانند. واژه های تازه ساخت نیز تازمانی که در جامعه مقبولیت لازم را به دست نیاورده باشند و در مدارک به کرات دیده نشوند، در نظام های ذخیره و بازیابی اطلاعات یا ظاهر نمی شوند و یا میهمان چندروزه اند. بخش قابل توجهی از مشکلات نمایه سازان از رواج و کاربرد واژه ناشی می شود.متخصصان برای یک مفهوم واحد اصطلاحات متفاوت به کار می برند. حتی متخصصانی که در یک رشته و در یک جامعه کوچک کار می کنند خود را ملزم به هماهنگی در کاربرد واژه های تخصصی نمی بینند. به علاوه برای بسیاری از اصطلاح های وارداتی معادل های متفاوت در زبان فارسی وجود دارد که در مواردی همه ، کم و بیش ، به یک اندازه کاربرد دارند. این گونه مطالب به علاوه مسائل رسم الخط فارسی ، آوانویسی اسامی عناصر وترکیبات شیمیائی ، سرواژه ها و کوته نوشته ها سبب شده است تا ذخیره اطلاعات به زبان فارسی با کندی صورت گیرد و جستجو و بازیابی کارایی مطلوب را نداشته باشد. در این مقاله سعی خواهد شد نمونه هایی از تجربه های واژه گزینی در ذخیره اطلاعات ارائه شود تا با توجه به آنها، شاهد تسریع و تسهیل ذخیره و بازیابی اطلاعات به زبان فارسی باشیم .
منابع مشابه
تحلیل چالشهای پیوستهنویسی و جدانویسی واژگان فارسی در ذخیره و بازیابی اطلاعات در پایگاههای اطلاعاتی
مقدمه: ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایهسازان پایگاهها، کاربران و پدیدآورندگان منابع بهوجود آورده است. روش ...
متن کاملبررسی تأثیرات ریشهیابی در بازیابی اطلاعات در زبان فارسی
Using the language-specific behavior in information retrieval systems can improve the quality of the retrieved results significantly. Part of the word that remains after removing its affixes is called stem. Stemming process can be used for improving the relevancy of the results in information retrieval system. Different morphological variants of words (plural, past tense…) will be mapped into t...
متن کاملریزش کاذب در ذخیره و بازیابی اطلاعات
مقاله حاضر تعریف، وجه تسمیه و علل ریزش کاذب، ریزش کاذب در نمایه سازی کویک، کواک و پس همارا، شیوه های جلوگیری از ریزش کاذب، بویژه استفاده از ربط و نقش، و ارتباط ریزش کاذب با جامعیت و مانعیت را بیان می دارد. در پایان نیز ریزش کاذب در بانک های اطلاعاتی مورد بحث و بررسی قرار می گیرد.
متن کاملDegenerate Four Wave Mixing in Photonic Crystal Fibers
In this study, Four Wave Mixing (FWM) characteristics in photonic crystal fibers are investigated. The effect of channel spacing, phase mismatching, and fiber length on FWM efficiency have been studied. The variation of idler frequency which obtained by this technique with pumping and signal wavelengths has been discussed. The effect of fiber dispersion has been taken into account; we obtain th...
متن کاملضرورتهای نوین بازنـگری در ذخیره و بازیابی اطلاعات
فرایند سازماندهی اطلاعات، در طول تاریخ از اهمیت ویژهای برخوردار بوده و در هر زمان، بسته به نوع و ماهیت منابع اطلاعاتی و پارادایمها و رویکردهای مسلط، رهیافتهای متفاوتی برای سازماندهی اطلاعات مورد توجه قرار گرفته است. ولی امروزه همگام با توسعة جهان دانش، نیاز به بازنگری درنظامهای سازماندهی این جهان، جدیترشده. در این مقاله ابتدا ویژگیهای نظامهای طبقهبندی سنتی و سرعنوانهای موضوعی ب...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
پژوهشنامه پردازش و مدیریت اطلاعاتجلد ۱۷، شماره ۱، صفحات ۱۹-۲۶
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023